Python生成式人工智能基礎：模型適應的範疇

想像一個大型語言模型（LLM）如同一位聰明但通才的學者。要將這位通才轉變為專門領域的專業人士——例如臨床放射科醫生或合約律師——我們必須在模型適應的範疇中尋找途徑。這個範疇定義了我們如何從零樣本提示演進到深度神經網絡修改，並在硬體限制與追求前沿（SOTA）成果之間取得平衡。

情境內學習（ICL）：模型保持「凍結」狀態。它透過觀察提示中的範例來估計 $P(y|x)$。雖然速度快，但通常會因高變異性而產生幻覺。
對齊與穩定性：為了達到生產級別的可靠性，我們必須向右移動。微調能提供更佳的與人類判斷的對齊，透過明確懲罰與真實資料模式的偏差。
SOTA 的目標：達成頂尖表現需要權衡取捨。完整微調雖提供最大控制力，但有導致「災難性遺忘」的風險，而 PEFT（參數效率型微調）則提供了對硬體友善的中間路徑。

實際應用範例

舉例來說，假設有一個醫療助理。使用 ICL，你在提示中提供三個症狀至診斷的範例。使用微調，你用5萬筆醫療記錄訓練模型。後者所產生的模型能自然理解臨床術語，並展現出更高的 一致性與穩定性。